注意力指导是一种解决深度学习中数据集偏见的方法,该模型依赖于错误的功能来做出决策。为了关注图像分类任务,我们提出了一个有效的人类在环境系统中,以交互性地将分类器的注意力引向用户指定的区域,从而降低了共发生偏见的影响,并提高了DNN的可传递性和可解释性。以前的注意力指导需要准备像素级注释,而不是被设计为交互式系统。我们提出了一种新的交互式方法,可让用户简单地点击注释图像,并研究一种新颖的主动学习策略,以显着减少注释的数量。我们既进行了数值评估,又进行了用户研究,以评估多个数据集上提出的系统。与现有的非活性学习方法相比,通常依靠大量基于多边形的分割口罩来微调或训练DNNS,我们的系统可以节省大量的劳动力和金钱,并获得一个效用更好的网络即使数据集有偏见。实验结果表明,所提出的系统是有效,合理且可靠的。
translated by 谷歌翻译
本文报告了在固体表面上溅出的滴滴和时间演化的特征,这些特征是通过图像序列分类提取的,使用高度可解释的前馈神经网络(FNN),其隐藏层为零。用于训练验证和测试FNN的图像序列显示了毫米大小的乙醇滴的早期变形,这些乙醇液滴会影响亲水性玻璃基材,Weber数量范围为31-474(溅出阈值约为173)。进行特定的摄像条件和数字图像处理,以确保图像序列之间的高相似性。结果,受过训练的FNN的测试精度高于96%。值得注意的是,该特征提取表明,受过训练的FNN鉴定出空气动力学上升起的二滴液滴的时间演变,而主体的相对较高的轮廓是溅出的特征,而相对较短的薄片则是相对较短而厚的薄片。非挡板滴的功能。除了溅到和非挡块滴剂之间主体的轮廓高度的差异外,已经确定了这些特征的物理解释及其各自的时间进化。这项研究中报道的观察结果对于开发数据驱动的模拟很重要,以建模对固体表面撞击期间溅出的滴落变形。
translated by 谷歌翻译
本文重新访问了符号回归的数据集和评估标准,该任务是使用数学方程式表达给定数据的任务,特别关注其科学发现的潜力。专注于基于Feynman物理学讲座的现有数据集中使用的一组公式,我们重新创建了120个数据集,以讨论科学发现(SRSD)符号回归的性能。对于120个SRSD数据集中的每个数据集,我们仔细查看公式及其变量的属性,以设计合理逼真的值的值范围,以便可以使用我们的新SRSD数据集来评估SRSD的潜力,例如SR方法是否是SR方法con(re)从此类数据集中发现物理定律。作为评估度量,我们还建议在预测方程和地面方程树之间使用归一化的编辑距离。虽然现有指标是目标值和SR模型之间的二进制或误差,但标准化的编辑距离评估了地面真相和预测方程树之间的相似性。我们已经使用SRBENCH中的五种最先进的SR方法在新的SRSD数据集上进行了实验,并基于最新的变压器体系结构进行了简单的基线。结果表明,我们提供了更现实的性能评估,并为科学发现开辟了新的基于机器学习的方法。我们的数据集和代码存储库公开可用。
translated by 谷歌翻译
表面通常被建模为3D点的三角形网格,质地与网状面孔相关。 3D点可以是从范围数据中采样的,也可以使用立体声或结构 - 移动算法从一组图像中得出。当这些点不在真实表面的最大曲率或不连续性的临界点时,网格的脸部不靠近建模的表面。这会导致纹理伪影,并且该模型与一组实际图像并不完全一致,这些图像用于纹理绘制其网格。本文提出了一种通过重新定位其顶点来完善3D表面模型的技术,使其与一组观察到的物体图像相干。从多个观点观察到的,纹理伪影和与图像的不一致是由于表面贴片的非平面度近似。从角度来看,图像区域用于代表本征空间中补丁的纹理。特征空间表示捕获了纹理的变化,我们试图最小化。基于从本征空间重建的面部纹理和实际图像之间的差异的相干度量用于重新定位顶点,以改善模型或改进模型。我们将这种模型改进的技术称为特征法,通过几何和质感,模型可以更好地近似真实的表面。
translated by 谷歌翻译
Pose Machines provide a sequential prediction framework for learning rich implicit spatial models. In this work we show a systematic design for how convolutional networks can be incorporated into the pose machine framework for learning image features and image-dependent spatial models for the task of pose estimation. The contribution of this paper is to implicitly model long-range dependencies between variables in structured prediction tasks such as articulated pose estimation. We achieve this by designing a sequential architecture composed of convolutional networks that directly operate on belief maps from previous stages, producing increasingly refined estimates for part locations, without the need for explicit graphical model-style inference. Our approach addresses the characteristic difficulty of vanishing gradients during training by providing a natural learning objective function that enforces intermediate supervision, thereby replenishing back-propagated gradients and conditioning the learning procedure. We demonstrate state-of-the-art performance and outperform competing methods on standard benchmarks including the MPII, LSP, and FLIC datasets.
translated by 谷歌翻译